
pr^'y WELTORGANISATION FOR GEISTIGES EIGENTUM 

X Jl Intematioiiales Btiro 

INTERNATIONALE ANMELDUNG VEROFFENTLICHT NACH DEM VERTRAG OBER DIE 
INTERNATIONALE ZUSAMMENARBETT AUF DEM GEBIET DES PATENTWESENS (PCT) 



(51) Internationale Patentklassifikation ^ : 

G06F 11/267, GOIR 3173185, G06F 11/20 



Al 



(H) Internationale VeroffentUchungsnummer: WO 99/32975 

1. Juli 1999 (01.07.99) 



(43) Internationales 

VerofTentlichungsdatum 



(21) Internationales Aktenzeichen: 

(22) Internationales Anmeldedatum: 



PCT/DE98/03682 

15. Dezcmber 1998 
(15.12.98) 



(30) Prioritatsdatcn: 
197 57 200.6 



22. Dezcmber 1997 (22.12.97) DE 



(71) Anmelder (fUr alle Bestimmmgsstaaten ausser US): PACT IN- 

FORMATIONSHECHNOLOGIE GMBH [DE/DE]; Thelc- 
mannstrasse 15. D-81545 MQnchen (DE). 

(72) Erfinder; und 

(75) Erfinder/Anmelder (nur jur US): VORBACH, Martin 
[DE/DE]; Hagebuttenweg 36, D-76149 Karlsruhe (DE). 
MONCH, Robert [DE/DE]; Hagebuttenweg 36. D-76149 
Karlsnihe (DE). 

(74) Anwalt: PIETRUK. Claus. Peter. Im Spcitel 102. D-76229 
Karlsruhe (DE). 



(81) Bestimmimgsstaaten: AL. AM. AT, AU. AZ. BA. BB, BO, 
BR. BY. CA. CH, CN. CU. CZ. DE, DK. EE, ES, FI, GB, 
GD. GE. GH. GM. HR, HU, ID. IL. IN. IS. IP, KE. KG. 
KP. KR, KZ, LC, LK. LR. LS, LT, LU, LV. MD. MG. MK. 
MN. MW. MX. NO. NZ. PL. PT. RO, RU. SD. SE, SG, 
SI, SK, SL. TJ, ™, TR. TT. UA. UG. US, UZ, VN, YU, 
ZW. ARIPO Patent (GH. GM, KE, LS. MW. SD, SZ, UG. 
ZW). curasisches Patent (AM, AZ, BY, KG. KZ. MD. RU, 
TJ, TM). europaisches Patent (AT, BE, CH. CY, DE, DK, 
ES, Fl FR. GB. GR. IE. IT. LU. MC. NL. PT, SE). OAPI 
Patent (BF. BJ, CF, CG, CI. CM. GA, GN. GW, ML. MR, 
NE. SN, TD. TG). 



VerofTentlicht 

Afit internationalem Recherchenbericht. 

Vor Ablauf der jur Anderungen der Anspriiche zu^elassenen 

Frist; Veroffentlichung wird wiederholt falls Anderungen 

eintreffen. 



(54) Title: PROCESS FOR REPAIRING INTEGRATED CIRCUITS 

(54) Bezeichnung: VERFAHREN ZUR REPARATUR VON INTEGRIERTEN SCHALTKREISEN 

(57) Abstract 

In a process for repairing integrated circuits, individ- 
ual subassemblies or a number of subassemblies are first 
associated with an additional, identical subassembly; a mul- 
tiplexer is connected upstream of the subassembly inputs 
to connect the input bus of each subassembly to the follow- 
ing subassembly; a multiplexer is connected downstream of 
the subassembly outputs to receive the output bus of each 
subassembly from the following subassembly; and finally, 
in the event of a failure of one of the subassemblies, the 
multiplexers axe switched in such a way that the defective 
subassembly is replaced by the following one, and the fol- 
lowing subassembly is replaced by the following one, and 
so on until the last subassembly is replaced by the addi- 
tional subassembly. 

(57) Zusammenfassung 

In Verbindung mit einem Verfahren zur Reparatur 
von integrierten Schaltkreisen wild vorgeschlagen, daS 1. 
einer einzelnen oder einer Mehrzahl von Baugruppen eine 

weitere gleidie Zusatzbaugruppe zugeordnet ist, da6 Z den Ein^ngen der Baugruppen ein Multiplexer vorgeschaltet ist, der den 
Eingangsbus einer Baugruppe auf die Jewells nachfolgende Baugruppe schalten kann, daB 3. den AusgSngen der Baugruppen ein Multiplexer 
nachgeschaltet ist, der den Ausgangsbus einer Baugruppe von der Jewells nachfolgenden Baugruppe erhalten kann, daS 4. im Fall eines 
Defektes in einer der Baugruppen die Multiplexer so geschaltet werden. daB die defekte Baugruppe durch ihre Nachfolgende ersetzt wird, 
wobei die nachfolgende Baugruppe durch deren Nachfolgende ersetzt wird, so lange. bis die letzte Baugruppe durch die Zusatzbaugruppe 
ersetzt wird. 
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Verfahren zur Reparatur von integrierten Schaltkreisen 

1. Hintergrund der Erfindung 
1.1 Stand der Technik 

1.1.1 Mehrdimensionale Arrays aus Rechenwerken 
Aus DE 196 51 075.9-53 sind Prozessoren mit einer Mehrzahl 
von 2- Oder mehrdimensional angeordneten Rechenwerken/Zellen 
bekannt. Die Rechenleistung derartige Prozessoren steigt mit 
der Zahl der vorhandenen Rechenwerken an. Daher wird 
versucht moglichst viele Rechenwerke auf einen Chip zu 
integrieren, wodurch die benotigte Flache ansteigt. Mit 
steigender Flache, wachst gleichzeitig die 

Wahrscheinlichkeit, daii der Chip bereits bei der Herstellung 
Fehler aufweist und unbrauchbar ist. Demselben Problem 
unterliegen alle in Matrix-Form angeordnete Rechenwerke, 
z.B. auch andere bekannte bekannten Typen wie DPGAs, Kress- 
Arrays, Systolische Prozessoren und RAW-Machines; genauso 
wie einige Digitalen Signalprozessoren (DSPs), die mehr als 
ein Rechenwerk besitzen. 

Gleichzeitig sind alien genannten Typen sehr testintensiv, 
d.h- urn die Fehlerhaf tigkeit nachzuweisen miissen besonders 
viele Testfalle in bezug auf die Funktion der Zellen und 
Vernetzung generiert und getestet werden. Herkoiranliche 
bekannte Methoden wie BIST, Boundary Scan, etc. sind 
aufgrund der erheblichen Menge an Testvektoren schlecht zu 
integrieren und zu zeit- und platzintensiv. 
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1.1.2 Standardprozessoren 

Standardprozessoren wie beispielsweise die bekannte x86- 
Reihe, MIPS Oder ALPHA besitzen mehrere Rechenwerke/ die 
zeitversetzt oder durch einen VLIW-Befehl gleichzeitig 
angesteuert werden. In Zukunft wird die Zahl der 
integrierten Recheneinheiten (Integer-Units) und Flielikomma- 
Rechenwerke (Floating-Point-Units) weiter ansteigen. Jedes 
der Rechenwerke mufi ausreichend getestet werden und 
weitestgehend fehlerfrei sein. 

1.2 Probleme 

1.2.1 Mehrdimensionale Arrays aus Rechenwerken 

Durch die steigende Fehlerwahrscheinlichkeit bei grofien 
Chips konnen entweder nur sehr wenige Zellen integriert 
werden, oder die Produktionskosten werden bedingt durch den 
entstehenden AusschuB erheblich. Bei sehr groiien Chips wird 
eine maximale Flache erreicht, iiber der hinaus kein 
funktionsf ahiger Chip mehr hergestellt werden kann. 
Durch den Zeitaufwand beim Testen nach herkornmlichen 
Verfahren steigen die Testkosten stark an. Eingebaute BIST- 
Funktionen (Build In Self Test) verschwenden durch hohen 
Zusatzaufwand sehr viel Flache, die die Kosten nach oben 
treibt und die Herstellbarkeit verringert. Zudem steigt die 
Wahrscheinlichkeit stark an, daft ein Fehler nicht innerhalb 
der eigentlichen Funktionseinheiten sonderen innerhalb der 
Teststrukturen liegt. 

1.2.2 Standardprozessoren 

Durch die steigende Zahl der Rechenwerke steigt die 
Fehlerwahrscheinlichkeit an. Dadurch bedingt wird der 
AusschuJi hoher, wodurch die Herstellungskosten steigen. Mit 
wachsender FlSche und der damit verbundenen Steigerung der 
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Transistormenge wMchst die Ausf allwahrscheinlichkeit bei der 
Benutzung. 

Bezuglich des Testaufwandes und der BIST-Implementierung 
gilt das bereits fiir "Mehrdimensionale Arrays aus 
Rechenwerken" Gesagte. 

1.3 Verbesserung durch die Erfindung, Aufgabe 

GemaB der vorliegenden Erfindung ist es moglich defekte 

Zellen durch Funktionsfahige zu ersetzen und damit den 

Ausschuli zu verringern. Dabei kann eine Ersetzung entweder 

mittels Testsystemen bei der Herstellung der Chips erfolgen 

Oder sogar beim Anwender im komplett aufgebauten System* 

Es ist moglich Testvektoren gemaJi dem BIST-Prinzip innerhalb 

des Chips, als auch gemali einem neuen Verfahren auiierhalb 

des Bausteins zu generieren, um Flache und Kosten zu sparen. 

Weiterhin wird eine Moglichkeit beschrieben, wie Chips 

automatisch Defekte reparieren konnen, ohne dali ein externes 

zusatzliches Werkzeug dafur notwendig ist. 

Samtliche Tests und Reparaturen k5nnen zur Laufzeit der 

Chips durchgefuhrt werden. 

2. Beschreibung der Erfindung 

2.1 Detailbeschreibung der Erfindung 

2.1,1 Ersetzen defekter Zellen 

Einer Gruppe von Zellen, die im Weiteren in Anlehnung an DE 
196 51 075.9-53 mit PAEs bezeichnet werden, wird eine 
zusatzliche, im normalen Betrieb nicht benutzte PAE 
zugeordnet (die im Folgenden PAER genannt wird) . Die Zellen 
konnen Rechenwerke jeder Art, konf igurierbare 
(programmierbare) Logikzellen oder andere Cores beliebiger 
Funktion sein. Bei der Gruppierung der PAEs und der 
Zuordnung der PAER ist eine spalten- oder zeilenweise 
Gruppierung der PAEs vorzuziehen, da hierdurch die 
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Vernetzung vereinfacht wird. In Hinblick auf zukianftige 
Chiptechnologien, wird auf eine in5gliche Gruppierung der 
PAEs innerhalb einer 3. Dimension hingewiesen. Vor die 
Eingange der PAEs warden derart Multiplexer geschaltet, dal3 
der Eingang ersten PAE in der Zeile/Spalte auch auf den 
Eingang der zweiten PAE in der Zeile/Spalte geschaltet 
werden kann, wobei dann auch der Eingang der zweiten PAE auf 
den Eingang der dritten PAE geschaltet wird und so weiter. 
Der Eingang der letzten PAE wird auf den Eingang der PAER 
geschaltet. Das bedeutet, daft bei einem Defekt der ersten 
PAE deren Funktion durch die Zweite, die Funktion der 
Zweiten durch die Dritte und so weiter ersetzt wird, bis die 
Funktion der letzten PAE durch die PAER ersetzt wird. 1st 
eine PAE innerhalb der Spalte/Zeile defekt, werden die vor 
ihr liegenden PAEs normal beschaltet und ab der Stelle der 
defekten PAE alle Funktionen urn eine PAE verschoben. 1st 
beispielsweise die PAE 4 defekt, so fahren die PAEs 1..3 
ihre jeweilige Funktion aus, wahrend der Eingangsmultiplexer 
der PAE 5 so geschaltet ist, daJi er die Daten der PAE 4 
erhalt, der Eingangsmultiplexer der PAE 6 erhalt die Daten 
der PAE 5 und so weiter, bis der Eingang der PAER die Daten 
der letzten PAE erhalt. 

Urn die Ergebnisse wieder in der richtigen Reihenfolge der 
Vernetzung zuzufuhren werden an den Ausgangen der PAEs 
ebenfalls Multiplexer angebracht, wobei der 

Ausgangsmultiplexer der PAE 1 entweder die PAE 1 auf den Bus 
schaltet - sofern diese nicht defekt ist - oder bei einem 
Defekt den Ausgang der PAE 2 auf den Bus schaltet, an Stelle 
der PAE 2 wird dann die PAE 3 auf den Bus geschaltet, bis 
hin zur letzten PAE, an deren Stelle die PAER auf geschaltet 
wird. Befindet sich die defekte PAE in der Mitte der 
Zelle/Spalte, so erfolgt eine Verschiebung der Ausgange in 
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genau der Art, wie sie fiir die Eing^nge bereits beschrieben 
wurde . 

Speziell bei konf igurierbarer Logik und konf igurierbaren 
Rechenwerken, treten zusatzliche Bussysteme auf , urn die 
Konf igurationsdaten zu iibermitteln und die Konf iguration zu 
steuern. Diese Bussysteme warden entsprechend der in diesem 
Abschnitt genannten Busse ebenfalls Qber Multiplexer 
verschaltet. Gleiches gilt fiir die Bussysteme, uber die bei 
einer matrixartigen Anordnung von Rechenwerken (z.B. 
Systolische Prozessoren, SIMD, etc), die Befehle in die 
jeweiligen Rechenwerke geschrieben werden. 
Grundsatzlich kann jeder Bus oder jedes Signal iiber 
Multiplexer geleitet werden. Je nach Anforderung an die 
Ausf allsicherheit kann beispielsweise das Taktsignal uber 
Multiplexer gefuhrt werden, urn einera eventuellen KurzschluB 
vorzubeugen; oder das Taktsignal wird direkt an die Zelle 
gefuhrt, weil ein derartiger Ausf all nicht abgefangen werden 
soli. Die Stufe der Ausf allsicherheit kann konstruktiv 
entsprechend den Anf orderungen fiir jedes Signal oder jeden 
Bus einzeln festgelegt werden. 

2.1.2 Ersetzen defekter Busse 

Das vorgestellte Konzept zur Fehlerkorrektur innerhalb von 
Gatterstrukturen ist in gleicher Weise auf Bussysteme 
anwendbar, Dabei wird einer Anzahl von Bussen (Bus 1 ... Bus 
n) ein zusatzlicher Bus (BUS R) zugeordnet. Ist einer der 
Busse def ekt (BUS d) , wird seine Funktion von einem seiner 
Nachbarbusse Qbernommen (BUS (d + 1)). Die Funktion des 
Nachbarbusses (BUS (d + 1)) wird von dessen Nachbarbus (BUS 
(d + 2)) ubernommen, usw., wobei die Richtung des 
iibernehmenden Busse immer die gleiche bleibt. So lange, bis 
BUS n durch BUS R ubernommen wird. 
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Bei der Anwendung der Multiplexer-Strukturen auf Bussysteme 
warden entsprechend der vorliegenden Verbindungsstruktur und 
der Richtung der Daten gewohnliche Multiplexer, Dekoder und 
Gates, Tristate-Gatter, oder Bidirektionale Multiplexer 
eingesetzt . 

2.1.3 Dekoder 

Es ist of f ensichtlich, daB immer zwei Gruppen von 
aufeinanderf olgenden Multiplexern denselben Zustand annehmen 
mussen, d.h. MUX 1 = MUX 2 = MUX3 = ... = MUX n = Zustand A 
und MUX (n + 1) = MUX (n + 2) = MUX (n + 3) = ... = MUX m = 
Zustand B. 

Ist keine PAE defekt gilt MUX 1 = MUX 2 = ... = MUX m = 
Zustand A. 

Ist die erste PAE defekt gilt MUX 1 - MUX 2 = ... = MUX m = 
Zustand B. 

Ist beispielsweise PAE 3 defekt gilt MUX 1 = MUX 2 = Zustand 
A, MUX 3 == MUX 4 = . . . = MUX m = Zustand B, wobei in diesem 
Beispiel PAER der PAE m zugerordnet ist, d.h. PAER befindet 
sich direkt neben PAE m. 
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Die Ansteuerung der Multiplexer sieht daher beispielsweise 
wie folgt aus 



Defekte PAE 


Multiplexer 




Ansteuerung 


keine 


0000. . 


.000 


m 


0000. , 


.001 


m-1 


0000. . 


.011 


m-2 


0000. . 


.111 


4 


0001. , 


.111 


3 


0011. . 


.111 


2 


0111. . 


.111 


1 


1111. . 


. Ill 



1st die PAER der PAE 1 zugeordnet, so ist die Reihenfolge 
m...l vertauscht (Defekte PAE 1 entspricht 0000... 001, bzw. 
defekte PAE m entspricht 1111... 111). 

Es ist daher ausreichend die Nummer der defekten PAE zu 
speichern und diese einem Dekoder zuzufiihren, der anhand der 
oben abgebildeten Tabelle die Zustande der Multiplexer 
ansteuert . 

2.1.4 Durchfuhrung des Selbsttests 

Grundsatzlich konnen beliebige Teststrategien auf das 
Verfahren angewendet werden, wobei das folgende 
erfindungsgemaiie Verfahren als besonders geeignet angesehen 
wird: 

Das Array aus PAEs wird mit einem oder mehreren 
Testalgorithmen geladen, die ein oder mehrere Testvektoren 
berechnen. An einer Kante des Arrays werden die PAEs als 
Vergleicher geschaltet, so dali die anhand der Testvektoren 
berechneten Werte mit den Sollergebnissen verglichen werden. 
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Entspricht das berechnete Ergebnis nicht den Sollergebnissen 
liegt ein Fehler vor. Die Testdaten, also die 
Testalgorithme.n, die Testvektoren und die Sollergebnisse 
liegen dabei in einem internen oder externen Speicher vor 
Oder werden von einer iibergeordneten Einheit geladen. Es ist 
bei dieser Teststrategie notwendig, daft ein jeder 
Testalgorithmus mindestens zweimal berechnet wird, wobei 
beim zweiten Mai die als Vergleicher ausgestalteten PAEs an 
einer anderen Kante liegen (vorzugsweise der 
gegeniiberliegenden) , um eine Ausfiihrung des 
Testalgorithmusses auf alien PAEs zu gewahrleisten. 
Ebenfalls ist es denkbar, daft die Vergleicher im Inneren des 
PAE-Arrays angeordnet sind und von links und rechts {oben 
und unten) jeweils ein Testalgorithmus A und B je ein 
Ergebnis A und B berechnet^ wobei die Ergebnisse den 
Vergleichen zugefiihrt werden und iibereinstimmen mussen. 
AbhSngig von der Art des Testalgorithmusses kann die 
fehlerhaft PAE anhand des Fehlers zurtickverf olgt werden oder 
nicht. Unterstutzt der Algorithmus eine Zurtickverf olgung , 
so werden die entsprechenden Multiplexer-Zustande der 
Zeile/Spalte in der sich die defekte PAE befindet geandert 
und den Multiplexern zugefuhrt. Der Testalgorithmus, bei dem 
der Test fehlschlug wird erneut ausgefiihrt um eine 
Fehlerf reiheit , die nun gegeben sein sollte zu iiberprufen. 
Ist der Baustein weiterhin fehlerhaft, muft iiberpruft werden, 
ob eventuell weitere oder andere PAEs defekt sind. Dabei ist 
die Ausfiihrung des Testalgorithmusses und die Generierung 
der dem Fehler angepaftten Multiplexer zustande iterativ. 
Oblicherweise ist es nicht ausreichend nur einen 
Testalgorithmus zu implement ieren, vielmehr mussen mehrere 
unterschiedliche Testalgorithmen implementiert sein, die 
jeweils mit mehreren Testvektoren gepriift werden. Nur so ist 
eine maximale Fehlererkennungsrate zu erreichen. 
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Gleichzeitig mufi die Busvernetzung von Testalgorithmus zu 
Testalgorithmus geandert werden, damit auch die Bussysteme 
ausreichend gepruft werden. 

Auf die verschiedenen Ausfiihrungen der Testalgortihmen wird 
in nicht nahers eingegangen, da dies fUr das 
erfindungsgemafte Grundverf ahren nicht relevant ist. 

2.1.5 Interne Steuerung des Selbsttests 

Bausteinen wie DE 196 51 075.9-53, DPGAs, Kress-Arrays, 
Systolische Prozessoren und RAW-Machines gemeinsam ist ein 
integrierter Speicher, der einem oder mehreren PAEs 
zugeordnet ist und die Funktion des/der Rechenwerke 
bestimmt . 

Entsprechend des BIST Grundprinzips wird der Speicher um 
einen Bereich (TestMEM) erweitert, der die Testalgorithmen 
und -vektoren enthalt. Dabei kann dieser Speicher fest in 
Form eines ROMs oder wiederbeschreibbar mittels (E)EPROM, 
Flash-ROM, NV-RAM oder ahnlichem ausgestaltet sein. 
Um einen Selbsttest durchzufiihren wird an eine 
Speicherstelle innerhalb des TestMEM gesprungen und die dort 
abgelegte Testroutine ausgefiihrt (Internal Driven Self Test 
= IDST) . Dabei sind aufier der Erweiterung des Speichers (um 
den TestMEM) und einer Auswerteeinheit fur die bereits 
beschriebenen Vergleicher (ErrorCHK) keine weiteren BIST- 
typischen Zusatzbaugruppen auf dem Chip notwendig. 

2.1.6 Externe Steuerung des Selbsttests 
Durch die Verringerung der Baugruppen auf eine 
Speichererweiterung (TestMEM) und einer Auswerteeinheit der 
Vergleicher (ErrorCHK) wird eine weitere noch 
kostengiinstigere und platzsparendere Variante ermoglicht, 
Dabei wird kein interner TestMEM implement iert, vielmehr 
wird der gewohnliche interne Speicher von auiien mit dem 
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Testalgorithmus und den Testvektoren geladen (External 
Driven Self Test = EDST) ; das bedeutet, die BIST-Testdaten 
werden nach auJien verlagert und wie ein normales Programm 
betrachtet. Danach wird der Testalgorithmus ausgefuhrt. 
Alternativ kann der Testalgorithmus auch wahrend der 
Ausfiihrung sucessive aus einem externen Speicher geladen und 
dekodiert werden. Lediglich die ErrorCHK-Einheit muft noch 
auf dem Chip integriert sein. Um den Testalgorithmus und die 
Testvektoren von auften in den/die chipinternen Speicher zu 
laden gibt es mehrere M5glichkeiten. Prinzipiell kann der 
Vorgang durch eine funktionell ubergeordnete CPU oder 
Recheneinheit (HOST) erfolgen, in dem diese die Testdaten 
(Testalgorithmus und Testvektoren) auf den Chip ladt 
(Download) oder der Chip ladt die Testdaten selbstandig aus 
einem externen (Dualported-) RAM oder Festspeicher wie ROM, 
(E)EPROM, Flash-ROM, NV-RAM, o.a.. 

2.1.7 Oberpufung der Funktion zur Laufzeit 
BIST-Verfahren nach den Stand der Technik fuhren den 
Selbsttest fiir gewohnlich nur wahrend der RESET-Phase, also 
kurz nach dem Anlegen der Spannung (dem Einschalten) , des 
Chips durch. Im Gegensatz dazu ist es moglich bzw. sinnvoll 
die in dieser Schrift beschriebenen Verfahren wahrend der 
Laufzeit der Programme auf den Chips durchzufuhren. 
Beispielsweise kann ein kompletter Test des Chips wahrend 
der RESET-Phase durchgefiihrt werden und jeweils ein Teil der 
vorhandenen Testdaten wahrend der Ausfuhrung des 
Anwenderprogrammes bzw. wahrend sogenannter IDLE-Zyklen, das 
sind Zeitraume, in denen kein Programm auf den Chips lauft, 
bzw. der Chip im Wartezustand ist. Dies ist ohne weiteres 
moglich, in dem wahrend den IDLE-Zyklen einer der 
Testalgorithmen im internen Speicher angesprungen wird, bzw. 
vom externen Speicher oder HOST in den Baustein geladen 
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wird. Dabei ist es verstandlicherweise moglich, aus der 
Mehrzahl der vorhandenen Testalgorithmen und Testdaten 
partiell einen oder mehrere auszuwahlen, wobei die Anzahl 
der ausgewahlten Testdaten anhand der Lange des IDLE- 
Zyklusses festgelegt werden kann, Es konnen so lange neue 
Testdaten geladen werden, bis der IDLE-Zyklus durch das 
Eintreffen neuer zu verarbeitender Daten oder eines neu 
abzuarbeitenden Prograiranes oder einer anderen Anforderung 
beendet wird. 

Eine weitere MOglichkeit ist das feste Integrieren von 
Teststrategien in die Anwenderprogramme, um wahrend der 
Verarbeitung des Anwenderprogrammes Tests durchzufuhren . 
In beiden Fallen werden die relevanten Daten, die sich im 
Array befinden, vor dem Aufruf der Testalgorithmen 
gesichert. Es bietet sich an, dafi die Daten entweder in 
interne Speicherbereiche (vgl. PACT04) oder die extern 
angeschlossenen Speicher gesichert werden. Nach Ausfuhrung 
der Testalgorithmen werden die Daten vor der normalen 
Prograininverarbeitung zuriickgelesen . 

Eine Alternative zur Steigerung der 

Ausfuhrungsgeschwindigkeit besteht darin, neben jedem 
Register (Reg-n, n e N) ein zusatzliches, nur fur die 
Testalgorithmen verwendetes. Register (TestReg-n, n e N) zu 
implementieren. Vor Ausfuhrung der Testalgorithmen, werden 
iaber Multiplexer/ Demultiplexer (Tore) die TestReg-n 
zugeschaltet und fur den Test verwendet. Die Reg-i3 bleiben 
unverandert. Nach Ausfuhrung der Testalgorithmen werden 
wieder die Reg-n zugeschaltet. 
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Sieht die Teststrategie vor, daB nur Zellen getestet werden, 
deren Daten im Folgenden nicht mehr relevant sind, kann auf 
das Sichern und Laden der Daten auch verzichtet werden. 

2.1.8 Speicherung der Nummer der defekten PAE 

Wird eine PAE (oder ein Bus) als defekt erkannt, muJi deren 
(dessen) Nummer, also der Zustandvektor (Def ektkennung) der 
zugeordneten Multiplexer gespeichert werden, zum einen um 
die Multiplexer anzusteuern, zum anderen um bei einem 
Neustart (RESET) des Chips sofort zur VerfQgung zu stehen. 
Hierzu kann die Defektkennung 

1. Chip-intern in einem programmierbaren Festspeicher 
{(E)EPROM, Flash-ROM, NV-RAM o.a.) gespeichert werden 

2. extern in einem programmierbaren Festspeichern ((E)EPROM, 
Flash-ROM, NV-RAM o.a.) gespeichert werden 

3. extern im HOST, innerhalb des auszuf uhrenden Programmes, 
in dessen programmierbaren Festspeichern ((E)EPROM, Flash- 
ROM, NV-RAM o.a. oder auf anderen Speichermedien 
(magnetische, optische, etc.) gespeichert werden. 

2.1.9 Automatische Generierung der Multiplexer-ZustSnde 
Oblicherweise wird nach der Erkennung eines Defektes die 
defekte Zelle anhand des erkannten Fehlverhaltens 
zuruckverfolgt . Das ist bei entsprechenden Testalgorithmen 
moglich, sofern ein zusatzlicher Algorithmus zur 
Zuruckverfolgung des Fehlers existiert. Bei Kontrolle des 
Tests durch einen HOST kann die Zuruckverfolgung auf dem 
HOST durchgefuhrt werden. Existiert jedoch kein HOST kann 
oftmals die Zuruckverfolgung nicht innerhalb des defekten 
Chips integriert werden oder ist zu aufwendig. 

Zur Losung wird vorgeschlagen einen ladbaren Zahler vor 
jedem Dekoder zu integrieren. Im Normalfall wird in den 
Zahler die Nummer der defekten PAE geladen, wonach der 
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Dekoder die Zustande der Multiplexer wie bereits beschrieben 
ansteuert. 1st unbekannt, welche PAE defekt ist, kann der 
Zahler bei PAE 0 Oder PAE m beginnend jede mogliche 
potentiell fehlerhafte PAE ansprechen, indem nach jedem 
erfolglosen Test der Zahlerzustand so lange (je nach 
Implementierung) urn eine PAE verringert (von PAE m aus 
zahlend) oder erhoht (von PAE 0 aus zShlend) wird^ bis die 
defekte PAE erreicht wird und der Test ordentlich ablauft. 
Der nun erreichte Zahlerzustand wird als Zustandsvektor fiir 
die Ansteuerung der Multiplexer gespeichert und 
representiert die defekte PAE. Wird kein f unktionsf ahiger 
Zahlerzustand f estgestellt , liegt entweder ein anderer 
Fehler vor (evtl. in einer anderern Reihe/Spalte oder ein 
Busfehler) oder es ist mehr als eine PAE defekt. 
Ein Nachteil beim Einsatz von Zahlern ist, daB samtliche 
Moglichkeiten permutiert werden mussen, bis die fehlerhafte 
PAE gefunden wurde. 

Eine weitere Moglichkeit, die allerding mehr 
Implemetierungsaufwand erfordert, ist daher der Einsatz von 
LookUp-Tabellen, die anhand des gerade ausgefuhrten 
Testalgorithmusses und des entstandenen Fehlerzustandes in 
ErrorCHK die entsprechende defekte PAE auswahlen. Dazu ist 
es jedoch notwendig, daii die Testalgorithmen und Lookup- 
Tabellen aufeinander abgestiinint sind. Auf die Abstimmung 
soil jedoch nicht weiter eingegangen werden, da diese sehr 
chipspezif isch und unabhangig vom Grundprinzip ist. 

2.1.10 Besondere Ausgestaltung fur Standard-Prozessoren 
(Pentium, MIPS, ALPHA, etc). 

Aktuelle und zukiinftige Prozessoren enthalten eine Mehrzahl 
an Integer- und Flieftkommaeinheiten. Daher ist das 
beschriebene Verfahren direkt auf diese Bausteine anwendbar, 
in dem jeweils eine zusatzliche Einheit implementiert wird 
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und fur eventuelle Defekte zur VerfUgung steht. Der Test der 
Prozessoren kann beim Hersteller, wahrend des Startvorganges 
der Computer Oder ebenfalls wahrend der Laufzeit 
stattfinden. Besonders sinnvoll ist dabei ein Test wahrend 
des Boot-Vorganges, also dem Starten des Rechners nach einem 
Reset, der bei PCs vom sogenannten BIOS (Basic Input Output 
System) , durchgefiihrt wird. Dabei konnen die entsprechenden 
Zustandvektoren der Multiplexer entweder auf dem Prozessor 
Oder in externen Speichern, beispielsweise der PC-internen 
batteriegepuf f erten Echtzeituhr (RTC) abgelegt werden. 

3. Zusammenf assung 

Das vorliegende Verfahren ermoglicht den Austausch defekter 
Einheiten, die in dieser Schrift als Rechenwerke 
ausgestaltet sind, jedoch generell jede beliebige Einheit 
eines Chips darstellen konnen, durch f unktionsttichtige . 
Gleichzeitig wird ein Verfahren aufgezeigt, mit dessen Hilfe 
Selbsttests einfacher, kostengiinstiger und vor oder wahrend 
des Ablaufs des Anwenderprogrammes durchgefuhrt werden 
konnen. Dadurch wird die Ausf allsicherheit auch im Betrieb 
erheblich vergroBert, was insbesondere fur ausf allkritische 
Anwendungen wie Kraf twerksbetriebe, Luft- und Raumfahrt oder 
Militar von besonderer Bedeutung ist. 

4 . Kurzbeschreibung der Diagramme 

Die folgende Diagramme zeigen zur Verdeutlichung 

Ausfiihrungsbeispiele des erf indungsgemaUen Verfahrens: 

Fig. 1 Grundschaltung 

Fig. 2 keine PAE defekt 

Fig. 3 PAEl defekt 

Fig, 4 PAEm defekt 

Fig. 5 PAE3 defekt 

Fig, 6 Array aus PAEs mit PAERs 



14 



wo 99/32975 



PCT/DE98/03682 



Fig. 7 Fehlertolerantes Bussystem 

Fig. 7a Prinzip eines Selbsttests erster Teil 

Fig. 7b Prinzip eines Selbsttests zweiter Teil 

Fig. 8a EDST in einem externen ROM integriert 

Fig. 8b EDST in einen externen RAM-Bereich integriert 

Fig. 8c EDST direkt- vom HOST gesteuert 

Fig. 9 Beispiel eines chipinternen Speichers mit BIST- 

Funktion integriert in eine interne Steuereinheit 
nach DE 196 54 846.2 

Fig, 10 Beispiel eines f ehlertoleranten Standard- 

Prozessors 

Fig. 11 Ablaufdiagraimn eines Selbsttests 

Fig. 12 Ablaufdiagranun der Generierung neuer Multiplexer 

Zustandsvektoren 
Fig. 13 Ablaufdiagraimn eines Selbsttest wahrend des IDLE- 

Zyklusses 

Fig. 14 Ablaufdiagramm eines in das Anwendungsprogramm 

integrierten Selbsttests 
Fig. 15 Lookup Table zur Fehlerkorrektur 
Fig. 16 Beispiel eines f ehlertoleranten Bussystems 
Fig. 17 Sichern von Registern Reg-n in chipinterne 

Speicher vor dem Ausfiihren der Testalgorithmen 
Fig. 18 Sichern von Registern Reg-n in externe Speicher 

vor dem Ausfuhren der Testalgorithmen 
Fig. 19 Abschalten der Reg-n und Zuschalten der TestReg-n 

vor dem AusfUhren der Testalgorithmen 



4.1 Detailbeschreibung der Diagramme 
Fig. 1 zeigt das Grundprinzip der f ehlertoleranten 
Verschaltung. Alle PAEs (0101) sind in einer Reihe 
angeordnet, der letzten PAE ist die zusatzliche PAER (0102) 
zugeordnet. Vor der ersten PAE in der Reihe ist ein Tor 
(0103) geschaltet, das die Daten zu der PAE sperrt, sofern 
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diese PAE defekt ist. Ebenfalls ist vor die PAER (0102) ein 
Tor (0105) geschaltet, das die Daten zur PAER sperrt, wenn 
diese nicht be.notigt wird (oder defekt ist) . Die beiden Tore 
(0103 und 0105) sind optional und nicht zwingend 
erforderlich. Die Eingangsbusse (0111), die aus einer 
Mehrzahl von Einzelssignalen zusammengesetzt sind, werden 
iiber Multiplexer (0104) und die Tore (0103 und 0105) an die 
PAEs geleitet. Dabei k5nnnen die Daten ab einem Defekt um 
jeweils eine PAE nach rechts verschoben werden, bis zur 
PAER. Den Ausgangsbussen (0112), die aus einer Mehrzahl von 
Einzelssignalen zusammengesetzt sind, vorgeschaltet befinden 
sich ebenfalls Multiplexer (0106) die die Ergebnisse im 
Falle eines Fehlers wieder um eine Position nach links 
schieben, so dali der Fehler flir das Ergebnisbussystem (Menge 
aller 0112) nicht erkennbar ist. Die einzelnen 
Ansteuersignale (0117) fur die jeweiligen Multiplexer und 
Tore sind zu einem Bus (0110) zusammengef alit und werden von 
einem Dekoder (0107) generiert. Der Dekoder erhalt die 
Nummer der defekten PAE von der Einheit 0108, die entweder 
als Register oder als ladbarer Zahler ausgestaltet ist. Beim 
Einsatz einer Lookup-Tabelle zum Feststellten der defekten 
PAE aus dem von ErrorCHK generierten Fehler ist 0108 als 
Register implement iert, in das die Nummer der defekten PAE 
geladen wird. Wird die fehlerhafte PAE iiber eine Permutation 
gesucht, stellt 0108 einen ladbaren Zahler dar, der 
ausgehend von 0 alle moglichen PAEs durchzShlt, bis die 
Fehlerhafte gefunden wurde. Ist die Fehlerhafte bekannt, 
wird sie beim nachsten RESET-Vorgang direkt in den ladbaren 
zahler geladen. Zum Laden des Zahlers oder Registers (0108) 
steht das Lade-Signal LOAD (0115) zur Verfugung. Um den 
Zahler hochzuzahlen wird das Signal COUNT (0116) zum Zahler 
gefuhrt. Ober die Signale 0114 wird das Ergebnis des Zahlers 
zur Speicherung zuriickgef Qhrt . Die Ansteuerung des 
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ZMhlers/Registers und die Steuerung des zeitlichen Ablaufs 
wird von einer nicht gezeichneten Statemachine, einem 
externen HOST oder einer Vorrichtung gemaB DE 196 54 84 6.2 
ubernoimnen . 

In Fig. 2 sind die Zustande der Multiplexer (0104 und 0106), 
sowie der Tore (0103 und 0105) angezeigt, wobei keine PAE 
defekt ist und die PAER (0102) nicht verwendet wird. 

In Fig. 3 sind die Zustande der Multiplexer (0104 und 0106), 
sowie der Tore (0103 und 0105) angezeigt, wobei die PAE 1 
(0301) defekt ist und die PAER (0102) verwendet wird. 

In Fig. 4 sind die Zustande der Multiplexer (0104 und 0106), 
sowie der Tore (0103 und 0105) angezeigt, wobei die PAE m 
(0401) defekt ist und die PAER (0102) verwendet wird. 

In Fig. 5 sind die Zustande der Multiplexer (0104 und 0106), 
sowie der Tore (0103 und 0105) angezeigt, wobei die PAE 3 
(0501) defekt ist und die PAER (0102) verwendet wird. 

Fig. 6 zeigt ein Array aus PAEs (0601), wobei je einer PAE- 
Zeile eine PAER (0602) zugeordnet ist und jede Zeile eine 
separate Ansteuerung (0109, vgl. Fig. 1) besitzt. Dabei 
konnen eine Mehrzahl von Ansteuerungen auch zu einer 
einzigen den Zeilen ubergeordneten Ansteuerung 
zusanunengefalit sein. 

Fig. 7a zeigt einen moglichen ersten Test eines 
Algorithmusses . Dabei sind eine Mehrzahl von PAEs als 
Rechenelemente (0701) konf iguriert , die jeweils ihre 
Operation iiber einen Testvektor durchfUhren. Dabei sind die 
PAEs uber Bussysteme (0708) beliebiger Ausgestaltung 
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miteinander verbunden, Eine Reihe der PAEs (0702) ist als 
Vergleicher konf iguriert . Die in den Rechenelementen 
berechneten Werte werden in den Vergleichern mit einem 
vorgegebenen Wert verglichen. Stimmen beide Werte nicht 
uberein, liegt ein Fehler vor. Die Ergebnisse der Vergleiche 
werden liber ein Bussystem (0705) an einen Multiplexer (0703) 
gefuhrt, der so geschaltet ist, daB er die Ergebnisse der 
Vergleiche aus (0702) an eine beliebig ausgestaltete Einheit 
(ErrorCHK 0706) zum Feststellen eines Fehlers und eventuell 
dessen Auswertung weitergereicht wird. Die Fehlerauswertung 
(0706) gibt ihr Ergebnis iiber den Bus (0707) an den HOST 
Oder die steuernde Statemachine weiter (vgl. Fig. 1). 

Fig. 7b zeigt einen zweiten Test der uber die selbe Matrix 
aus PAEs durchgefuhrt wird wie Fig. 7b. Der auszuf uhrende 
Algorithmus ist derselbe, ebenso wie die zu berechnenden 
Werte. Dabei sind jedoch die PAEs der Zeile 0702 als normale 
Recheneleinente ausgestaltet , wobei jedoch die erste Zeile 
der vorher (Fig. 7a) als Rechenwerke geschalteten PAEs 
(0701) nun als Vergleicher (0711) ausgestaltet sind. Die 
Datenf luBrichtung auf den Bussystemen ist um 180° gedreht. 
Der Multiplexer (0703) ist so geschaltet daft die Ergebnisse 
der (gespiegelten) Vergleicher (0711) an die 
Fehlerauswertung (0706) weitergeleitet wird. Durch die 
Spiegelung der Vergleicher (0702 - 0711) wird erreicht, dali 
jede PAE tatsachlich in ihrer Funktion getestet wird. Wurde 
die Spiegelung nicht durchgefuhrt werden, wird in einer PAE- 
Reihe (0702 oder 0711) nur die Funktion des Vergleiches, 
nicht jedoch jede beliebige Funktion getestet. 

Die Implementierung eines weiteren Verfahrens als das den 
Fig. 7a und 7b zugrundeliegende kann unter Umstanden 
sinnvoll sein. Dabei wird die Matrix in drei Gruppen 
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unterteilt, einer Oberen, einer Mittleren und einer Unteren. 
In der oberen und unteren Gruppe werden Ergebnisse 
berechnet, wobei der Datenflufi der oberen Gruppe nach unten, 
der der unteren Gruppe nach oben gerichtet ist. Die mittlere 
Gruppe ist als Vergleicher konfiguriert und vergleicht die 
berechneten Werte der oberen Gruppe mit denen der unteren 
Gruppe, Fiir gewohnlich fuhren die obere und untere Gruppe 
dieselben Berechnungen durch. Sind die Ergebnisse an den 
Vergleichern unterschiedlich liegt ein Fehler vor. Auch bei 
diesem Verfahren ist darauf zu achten, dali die PAEs die als 
Vergleicher geschaltet sind in einer nachsten Konf iguration 
ausreichend auf ihre Fehlerf reiheit gepriift werden. 

Die Figuren 8 zeigen mogliche Beschaltungen zum Test eines 
Chips (0801) . Die Testdaten sind dabei extern gespeichert 
(EDST) . 

In Fig. 8a befinden sich die Testdaten in einem externen 
Festspeicher ((E) PROM, ROM, Flash-ROM, etc.) (0802). Die 
Daten liegen in einem RAM (0808) iiber den sie mit dem HOST 
(0805) ausgetauscht werden. Zur Speicherung der defekten 
PAEs, also der Zustandsvektoren der Multiplexer dient ein 
nicht fluchtiger Schreib-/Lese-Speicher (NV-RAM, EEPROM, 
Flash-ROM, usw. ) (0807). 

In Fig. 8b werden die Testdaten von einem HOST (0805) in 
einen Teil des RAM-Speichers (0803) geladen und von dort aus 
ausgefiihrt. Die Daten liegen in einem RAM (0808) uber den 
sie mit dem HOST (0805) ausgetauscht werden. Ebenfalls 
m5glich ist, dali der Chip selbst die Daten in den 
Speicherbereich (0803, 0808) ladt (ohne den Einsatz eines 
HOSTS ) , z.b. direkt von einem Massenspeicher. Zur 
Speicherung der defekten PAEs, also der Zustandsvektoren der 
Multiplexer dient ein nicht fluchtiger Schreib-/Lese- 
Speicher (NV-RAM, EEPROM, Flash-ROM, usw.) (0807). 
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Die in Fig. 8a/8b vom Chip generierten Fehler werden aus dem 
Baustein herausgef iihrt und sind extern verfiigbar (0804). 
In Fig. 8c werden die Testdaten schrittweise von einem HOST 

(0805) unter Verwendung einer geeigneten Schnittstelle 

(0806) zum Chip (0801) ubertragen. Der Chip zeigt einen 
eventuellen Fehlerzustand (0804) durch die Schnittstelle 
(0806) dem HOST an. Die Daten liegen in einem RAiVl (0808) 
liber den sie mit dem HOST (0805) ausgetauscht werden. 

In Fig. 9 ist eine Erweiterung eines chipinternen Programm- 
bzw. Konf igurationsspeichers gemafi DE 196 54 846.2 urn eine 
BIST-Funktion gemaft dem beschriebenen Verfahren dargestellt. 
Dabei ist der gew5hnliche Speicherbereich (0901) nach dem 
Stand der Technik durch einen Festspeicherbereich (0902), 
der fur gewohnlich als ROM implementiert ist - wobei auch 
eine Ausgestaltung als (E)EPROM, FLASH-ROM, NV-RAM usw. 
moglich ware, erweitert, in dem die Testdaten, d.h. die 
Testalgorithmen und Testvektoren gespeichert sind. Am Ende 
des Speichers ist ein weiterer Speicherbereich (0903) 
hinzugefugt. Dieser ist wenige Eintrage groii und beinhaltet 
die Adressen defekter PAEs und/oder defekter Busse, die in 
die Zahler/Register (0108) geladen werden. Dieser 
Speicherbereich ist als nicht fluchtiger Schreib- 
/Lesespeicher ausgestaltet (Flash-ROM, EEPROM, NV-RAM, 
usw.). Dadurch konnen die Daten beim RESET ausgelesen werden 
und nach dem Ablauf eines Testalgorithmusses, bei dem ein 
reparierbarer Fehler festgestellt wurde, mit den aktuellen 
Daten uberschrieben werden. Diese Daten werden entweder je 
nach Implementierung von den Zahlern (0108, Bus 0114) oder 
von den Lookup-Tabellen geliefert. 

Fig. 10 zeigt das Beispiel eines Standard-Prozessors mit 
implementierter Fehlerbehebung. Ober das Businterface (1001) 
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ist der Prozessor geraaft dem Stand der Technik an seine 
Peripherie angebunden. Dem Businterface zugeordnet sind zwei 
Multiplexer {1002 und 1003), wobei 1002 zwei alternative 
Code-Caches (1004, 1005) und 1003 zwei alternative Daten- 
Caches (1006, 1007) so ansteuert, daB jeweils nur einer der 
Caches verwendet wird, Damit steht jeweils ein Cache zum 
Ausgleich von Defekten zur Verfiigung und kann uber die 
Multiplexer angesprochen werden. Der Code-Cache fiihrt iiber 
einen Multiplexer (1008) zu der Kontrolleinheit (1009) des 
Prozessors, die in diesem Beispiel nur einmal existiert. Von 
der Kontrolleinheit werden die Integer-Rechenwerke (1010, 
1011, 1012) und die Floating-Point-Rechenwerke (1013, 1014, 
1015) gesteuert. Dabei werden jeweils zwei Rechenwerke im - 
Betrieb verwendet, ein jeweils Drittes steht zur Verfugung, 
wenn jeweils eines der Rechenwerke ausfallt. Ober die 
bidirektionalen Multiplexer (1016, 1017) werden jeweils 2 
Integer-Rechenwerke dem Datenbus (1018) zugeschaltet , tlber 
die bidirektionalen Multiplexer (1019, 1020) werden jeweils 
2 Floating-Point-Rechenwerke dem Datenbus (1018) 
zugeschaltet, Der Datenbus wird iiber einen bidirektionalen 
Multiplexer (1021) mit dem Datencache verbunden. Der 
Multiplexer 1003 ist ebenfalls bidirektional ausgestaltet . 
Die Ansteuerung der Multiplexer geschieht dabei nach dem 
bereits beschriebenen Verfahren. Dabei bilden die 
Multiplexer 1002, 1008, die Multiplexer 1003, 1021, die 
Multiplexer 1016, 1017, sowie die Multiplexer 1019, 1020 
jeweils eine abhangige Gruppe. 

Im Fehlerfall kann innerhalb des Beispielprozessors somit 
gemaJi dem beschriebenen Verfahren der Daten- und Code-Cache, 
sowie jeweils ein Floating-Point- und Integer-Rechenwerk 
ersetzt werden. 
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Der Ablauf eines Selbsttests ist in Fig. 11 dargestellt. 
Dabei ist die Variable n, n e (1, 2, . . . ) , der Index aller 
Algorithmen und definiert den momentan verwendeten 
Algorithmus. Jeder Algorithmus liegt dabei in einer ersten 
Positionierung (1101)/ die Fig. 7a entspricht, und einer 
zweiten gespiegelten Postitionierung (1102), die Fig. 7b 
entspricht, vor. Die Variable m e (1, 2, ... ), ist der 
Index der zu berechnenden und zu vergleichenden 
Testvektoren. Innerhalb jedes Algorithmus wird die Menge der 
Testvektoren komplett durchgetestet und danach der 
Algorithmus gewechselt, entweder von 1101 nach 1102 Oder von 
1102 auf einen neuen Algorithmus (n = n + 1) . Erreicht n den 
Wert nach dem letzten giiltigen Algorithmus, wird der Test 
abgebrochen. Wird wahrend der Berechnung (1103, 1104) der 
Testvektoren ein Fehler f estgestellt , wird eine 
Fehlerbehandlung durchgefUhrt, die in Fig. 12a, b genauer 
erlautert wird. Nach erf olgreicher Fehlerbehandlung werden 
alle Algorithmen erneut getestet, urn sicherzustellen, daft 
kein neuer Fehler durch die Korrektur entstand, wobei 
prinzipiell auch an der Stelle des momentan aktiven 
Algorithmus weitergetestet werden konnte. 

Zur Fehlerbehandlung werden zwei Verfahren vorgeschlagen : 
Fig. 12a zeigt die Generierung neuer Multiplexer-Zustande 
uber einen Zahler. Dabei ist die Variable v, v e (0, 1, ... 
(Anzahl d. PAEs)), die Nummer der defekten PAE. Ist keine 
PAE defekt, gilt v = 0. Zunachst wird v so erhoht, dali die 
nMchste PAE, vom PAE 1 beginnend, als defekt markiert wird. 
Danach wird der f ehlgeschlagene Test nochmals ausgefuhrt. 
Lauft der Test korrekt ab, ist sichergestellt , daB die PAE v 
defekt ist und v wird in einen nicht fluchtigen Schreib- 
Lese-Speicher (z.B. 0903) geschrieben. Schlagt der Test 
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erneut fehl, wird v so lange erhoht, bis entweder der Test 
korrekt ablauft Oder v die Position hinter der letzten PAE 
erreicht und damit erwiesen ist, daB die fehlerhafte Gruppe 
von PAEs nicht korregiert werden kann, entweder weil der 
Fehler an anderer Stelle liegt (z.B. Bussystem) , oder zwei 
Oder mehrere PAEs defekt sind. 

Fig. 12b zeigt eine weniger zeitaufwendige Moglichkeit. 
Dabei ist die bereits beschriebene Lookup-Tabelle 
integriert. Sie erhalt als Eingangswert die Indizes m und n, 
sowie die Nummer des Vergleichers der den Fehler 
festgestellt hat. Diese Nummer wird von ErrorCHK (0706) uber 
den Bus 0707 geliefert. Die Lookup-Tabelle liefert die 
Nummer v der defekten PAE zuruck. Danach wird der 
fehlgeschlagene Test nochmals ausgefuhrt. Lauft der Test 
korrekt ab, ist sichergestellt, daJi die PAE v defekt ist und 
v wird in einen nicht fluchtigen Schreib-Lese-Speicher (z.B, 
0903) geschrieben. Schlagt der Test erneut fehl wird davon 
ausgegangen, dali ein irreparabler Fehler vorliegt. 
Bei den meisten Testalgorithmen ist es moglich die Spalte 
der defekten PAE, jedoch nicht deren Zeile zu erkennen. 
Damit kann die Spalte der defekten PAE v ohne weiteres 
bestimmt werden, jedoch ist unbekannt, in welcher der 
Mehrzahl von Zeilen die defekte PAE liegt. Daher ist es in 
solchen Fallen notwendig die Fehlerbehandlung der Fig. 12a, b 
iiber alle Zeilen durchzufiihren, die an der Berechnung des 
Testalgorithmusses beteiligt waren, so lange, bis der Fehler 
festgestellt wurde oder samtliche Zeilen untersucht wurden 
und der Fehler unkorregierbar ist. 

Fig. 13 zeigt eine Moglichkeit einen Chip-Test w^hrend IDLE- 
Zyklen, das sind Zyklen, wahrend denen keine 
Programmausfiahrung stattfindet, weil auf eine Aktion 
(beispielsweise eine Tastatureingabe) gewartet wird. 
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durchzufiihren. Fur gew5hnlich werden derartige Zyklen durch 
Warteschleif en im Prograitimcode ausgedriickt. Es ist ohne 
weiteres moglich, bei Vorliegen einer solchen Wartebedingung 
eine Testroutine aufzurufen, die wahrend der Wartezeit einen 
Test des Chips durchfiihrt, wobei allerdings eine 
Echtzeitf ahigkeit bei der Reaktion auf die zu wartende 
Aktion nicht mehr moglich ist. Die aus Fig. 11 bekannten 
Indizes m und n werden in Fig. 13 mit gleicher Bedeutung 
iibernommen. Jedoch werden die Indizes im Datenspeicher 
abgelegt. Samtliche relevanten Daten in dem Array werden vor 
dem Aufruf der Testroutine gesichert und nach der Ausfiihrung 
der Testroutine wieder restauriert, Beim Aufruf der 
Testroutine werden die Indizes zunachst aus dem 
Datenspeicher geladen. Danach wird der entsprechende 
Algorithmus mit den entsprechenden Testvektoren ausgefuhrt. 
Ist das Ergebnis fehlerhaft findet eine Fehlerbehandlung 
gem. Fig. 12a, b statt. Ansonsten werden die Indizes neu 
berechnet und in den Datenspeicher zuruckgeschrieben. 
Abschliefiend wird getestet, ob weiterhin ein IDLE-Zustand 
vorliegt, d.h, auf eine Aktion gewartet wird. Liegt 
weiterhin ein IDLE-Zustand vor, wird die Testroutine erneut 

angesprungen, wobei diesesmal eine andere Berechnung 

gemafi der bereits durchgef uhrten Neuberechnung der Indizes - 
— durchgef uhrt wird. Liegt kein IDLE-Zustand mehr vor, wird 
die Programmausf uhrung normal weitergefuhrt • 

In Fig. 14 wird eine mCgliche Abwandlung aus Fig. 13 
dargestellt, in der die Testroutine direkt vom 
Anwenderprogramm aufgerufen wird (call TEST_CHIP (m,n)). Die 
Testroutine wird an bestimmten geeigneten Punkten im 
Algorithmus aufgerufen. Samtliche relevanten Daten in dem 
Array werden vorher gesichert und nach der Ausfiihrung der 
Testroutine wieder restauriert. Die Indizes m,n werden 
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direkt beim Aufruf mitubergeben . Innerhalb der Routine 
TEST_CHIP wird Algorithmus n mit den Daten m ausgefuhrt. Der 
Fehlertest findet gemali Fig. 11 und Fig. 13 statt. Am Ende 
von TEST_CHIP werden die Indizes im Gegensatz zu Fig. 11 und 
Fig. 13 nicht neu berechnet. Der Riicksprung aus der Routine 
TEST_CHIP fuhrt auf die Position direkt hinter dem Aufruf 
"call TEST_CHIP", vergleichbar mit dem BASIC-Standard GOSUB 
. . . RETURN . 

Eine mogliche Ansteuerung einer Lookup-Tabelle ist in Fig. 
15 dargestellt. Die Lookup-Tabelle (1501) ist als ROM 
implementiert . Die Indizes m, n; also die Kennung des 
momentan durchgefiihrten Testalgorithmus, die Kennung der 
aktuellen Testdaten, sowie das Ergebnis (0707) der ErrorCHK- 
Einheit (0706) werden dem ROM als Adressen (1502) zugefuhrt. 
Die daraus resultierenden Daten (1503) geben die Nummer der 
defekten PAE an. Diese Nummer wird in die Register (0108) 
ilbertragen. 

In Fig. 16 ist ein fehlertolerantes Bussystem dargestellt. 
Dabei ist einer Menge von gleichen Bussen (1601) ein 
zusatzlicher Bus (1602) zugeordnet. Das Bussystem besitzt 
Anschliisse in alien vier Himmelsrichtungen. Ober Multiplexer 
(1603) werden die Anschliisse an die Busse so geschaltet, dafi 
bei einem Ausfall eines Busses dessen Funktion durch den 
benachbarten (Darunterliegenden in der Horizontalen, bzw. 
Rechtsliegenden in der Vertikalen) Bus (ibernommen wird. 
Dabei werden alle Multiplexer die an einen bestimmten Bus 
geschaltet sind von derselben Steuerleitung angesprochen, 
beispielsweise werden die Multiplexer 1603a, die an den Bus 
1601a angeschlossen sind von der Steuerleitung 1604a 
gesteuert. Die Steuerleitungen 1604 werden von einer Einheit 
entsprechend 0109 aus Fig. 1 angesteuert. Die weitere 
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Ansteuerung und Fehlerbehandlung ist prinzipiell dieselbe, 
wie in den vorausgehenden Figuren beschrieben. 

Fig. 17 zeigt die Zuordnung eines chipinternen RAMs oder 
RAM-Bereiches (1701) zu einer Gruppe von Zellen (1702). Vor 
dem Ausfuhren der Testalgorithmen warden die internen 
Register der Zellen (1702) in den RAM oder RAM-Bereich 
(1701) gespeichert. Nach dem Ausfuhren der Testalgorithmen 
werden die Daten in die internen Register der Zellen 
zuruckgeschrieben. Das Schreiben und Lesen der Daten 
geschieht dabei uber die Multiplexer/Tore (0103, 0104 und 
0105) . Dadurch werden die Daten, die aus einer defekten 
Zelle stammen, gemaB der Stellung der Multiplexer an die zum 
Ersatz zugeschaltete Zelle geschrieben. Der Ablauf des 
Anwenderalgorithmusses wird durch das Testverf ahren nicht 
beeintrachtigt . 

Fig. 18 zeigt das in Fig. 17 beschriebene System, jedoch 
werden die Daten der Zellen in dem Chip (1801) in einen 
externen Speicher (1802) geschrieben, bzw. aus dem externen 
Speicher gelesen. 

In Fig. 19 ist die Verwendung von expliziten Testregistern 
TestReg-n dargestellt. Jedem internen Register Reg-n einer 
Zelle (1902) ist ein fur die Testalgorithmen verwendetes 
Register TestReg-n (1903) zugeordnet. Uber die Demultiplexer 
(das Tor) (1901) wird selektiert, in welches Register 
geschrieben wird; iiber den Multiplexer (1904) wird 
selektiert, aus welchem Register gelesen wird. Dabei ist die 
Ansteuerung der (De-) Multiplexer (1901, 1904) derart, dali 
im normalen Betrieb, d.h. wShrend des Ablauf es der 
Anwenderalgorithmen, das Reg-n (1902) selektiert wird und 
bei der Ausfuhrung des Testalgorithmus das TestReg-n (1903) 
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verwendet wird. Die Schaltung gemaB Fig. 19 ist fiir jedes 
relevante Register innerhalb einer Zelle implementiert . 
Nachteil der Schaltung ist, dali die Daten einer defekten 
Zelle nicht der als Ersatz zugeschalteten zur VerfOgung 
stehen. Zur Losung des Nachteils wird vorgeschlagen mittels 
der (De-) Multiplexer (1901, 1904) eine zusatzliche 
Verschaltung entsprechend des erf indungsgemaiien 
Grundprinzipes (0103, 0104 und 0105) zu realisieren. Damit 
koennen samtliche Daten der Ersatzzelle zur Verfugung 
gestellt werden. 
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Begrif f sdef inition 

Anwenderalgorithmus Anwenderspezif isches Programm, das auf 
dem Chip ablauft. 

Ausgangsmultiplexer Schaltung vergleichbar mit einem Relais, 
das zwischen mehreren moglichen Bussen an den AusgMngen von 
PAEs auswahlt. 

BIST Build In Self Test. In einen integrierten 

Schaltkreis implementierten Selbsttest, d.h, der TestMEM und 
alle Testf unktionen sind in den Schaltkreis eingeschlossen . 

Booten (Boot-Vorgang) Das Laden eines Grundprogrammes und 
Einstellung der Grundf unktionen nach einem Reset. 

Bus Bundelung aus mehreren Einzelsignalen / 
Einzelleitungen, die zusammen eine bestimmte 
Ubertragungsfunktion erfullen (Datenbus, Adressbus . , . ) 

EDST External Driven Self Test. In einen integrierten 

Schaltkreis implementierten Selbsttest, bei dem der TestMEM 
aufterhalb des integrierten Schaltkreises angeschlossen ist 
und auch Telle der Steuerung auBerhalb des Schaltkreises 
untergebracht sein konnen. 

Eingangsmulbiplexer Schaltung vergleichbar mit einem Relais, 
das zwischen mehreren moglichen Bussen an den Eingangen von 
PAEs auswahlt. 
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ErrorCHK In einen integrierten Baustein implement ierte 
Schaltung, die einen, Fehler wahrend BIST oder EDST erkennt 
und lokalisiert. 

HOST Einem integrierten Schaltkreis ubergeordnete 

Baugruppe oder Computer. 

IDLE Zustand in dem ein Prozessor oder ahnlicher 

Schaltkreis auf eine Aktion wartet und keine Verarbeitung 
durchfuhrt . 

Lookup-Tabelle Speicher, der anhand einer Adresse ein 

fest definiertes Datenwort beliebiger Breite zurucklief ert, 
zumeist als ROM oder ROM-ahnlichen Speicher implementiert , 

Nachbarbus Bus, der direckt neben einem anderen Bus 
liegt und denselben Aufbau besitzt. 

PAE Processing Array Element gemaB DE 196 51 075.9-53. 
Obwohl eine PAE in der Patentanmeldung DE 196 51 075.9-53 
ein Rechenwerk darstellt, wird der Begriff in dieser 
Patentschrif t allgemeiner fur jede beliebige Zelle, also 
beispielsweise Rechenwerke, Statemachines, Speicher, 
gebraucht . 

PAER Zelle, die zus^tzlich auf dem Integrierten 

Schaltkreis implementiert ist und ersatzweise fur eine 
defekte Zelle gleicher Bauart verwendet werden kann. 

RESET Das Setzen oder RUcksetzten eines integrierten 
Schaltkreises in einen definierten Grundzustand. Findet 
generell nach dem Anlegen von Spannung (Einschalten) statt. 
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Selbsttest Automatisches Testverf ahren, das in einen 
integrierten Baustein implementiert ist. 

Sollergebnisso Die Ergebnisse die von den 

Testalgorithmen geliefert warden miissen um die Korrektheit 
des integrierten Schaltkreises nachzuwei'sen. Stinunen die 
Sollergebnisse nicht mit den Berechnungen iiberein, liegt ein 
Fehler vor. 

Testalgorithmen Programm, das den integrierten Baustein 
testet; es enthalt alle mathematischen Funktionen und 
Verschaltungen die iiberpriift werden sollen. 

Statemachine Zustandsmaschine zur Ablauf steuerung von 
komplexen Operationen, auch Sequenzer. 

Testalgorithmus Programm zum Testen des Chips oder der 
Zellen einer Struktur. 

Testdaten Die Menge aller Testalgorithmen, Testvektoren 

und Sollergebnissen. 

TestMEM Speicher in dem die Testdaten abgelegt sind. 

Testroutine Einzelner Prograramabschnitt innerhalb der 
Testalgorithmen . 

Testvektoren Daten, mit denen die Testalgorithmen 
ausgefiihrt werden. 

Tore (Gates) Schalter die Daten weiterleiten oder 

sperren. 
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Zelle In sich abgeschlossene Baugruppe innerhalb 

eines integrierten Schaltkreises, beispielsweise 
Rechenwer ke , Statemachines , Speicher . 
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Patentanspruche 

1. Verfahren zur Reparatur von integrierten Schaltkreisen, 
dadurch gekennzeichnet, 

daft 1. einer einzelnen oder einer Mehrzahl von Baugruppen 

eine weitere gleiche Zusatzbaugruppe zugeordnet ist, 

daB 2. den Eingangen der Baugruppen ein Multiplexer 
vorgeschaltet ist, der den Eingangsbus einer 
Baugruppe auf die jeweils nachfolgende Baugruppe 
schalten kann, 

dali 3. den Ausgangen der Baugruppen ein Multiplexer 
nachgeschaltet ist, der den Ausgangsbus einer 
Baugruppe von der jeweils nachf olgenden Baugruppe 
erhalten kann, 

daB 4. im Fall eines Defektes in einer der Baugruppen die 
Multiplexer so geschaltet werden, dafi die defekte 
Baugruppe durch ihre Nachfolgende ersetzt wird, wobei 
die nachfolgende Baugruppe durch deren Nachfolgende 
ersetzt wird, so lange, bis die letzte Baugruppe 
durch die Zusatzbaugruppe ersetzt wird. 

2. Verfahren nach Anspruch 1, dadurch gekennzeichnet , dafi> 
die Ansteuerung der Multiplexer durch einen Dekoder erfolgt, 
der einen Binarwert so auskodiert, daB entweder alle 
Multiplexer gleich geschaltet sind oder zwei Gruppen von 
auf einanderf olgenden Multiplexern entstehen, wobei die 
Multiplexer innerhalb einer Gruppe gleich geschaltet, die 
beiden Gruppen jedoch unterschiedlich geschaltet sind, so 
daB eine defekte Baugruppe von den Multiplexern 
ausgeschlossen wird, 

3. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet, 
daB 
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der Binarwert von einem Zahler generiert wird, 

4. Verfahren nach Anspruch 1, 2 und 3, dadurch 
gekennzeichnet, daJi 

der Zahler im Fehlerfall so lange inkrementiert Oder 
dekrementiert wird, bis die defekte Baugruppe erreicht ist, 
Oder ein Endwert erreicht wird, 

5. Verfahren nach Anspruch 1 und 2, dadurch gekennzeichnet , 
dafi 

der Binarwert durch eine Lookup-Tabelle generiert wird, 

6. Verfahren nach Anspruch 1, 2 und 5, dadurch 
gekennzeichnet , daJi 

die Lookup-Tabelle anhand des durchgefuhrten Test und des 
erkannten Fehlers den Binarwert der defekten Baugruppe 
lief ert, 

7. Verfahren nach Anspruch 1 bis 6, dadurch gekennzeichnet, 
daB 

die Binarwerte der defekten Baugruppen in einem chipinternen 
Speicher abgespeichert warden um bei einem erneuten Start 
des Systems sofort zur Verfiigung zu stehen, 

8. Verfahren nach Anspruch 1 bis 6, dadurch gekennzeichnet, 
daJi 

die Binarwerte der defekten Baugruppen in einem chipexternen 
Speicher abgespeichert werden um bei einem erneuten Start 
des Systems sofort zur VerfUgung zu stehen, 

9. Verfahren nach Anspruch 1 bis 6, dadurch gekennzeichnet, 
daft 
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die Binarwerte der defekten Baugruppen von einer 
iibergeordneten Einheit verwaltet werden, 

10. Verfahren nach Anspruch 1 bis 9, dadurch gekennzeichnet, 
daft 

die Baugruppen Bussysteme darstellen. 

11. Verfahren zum Test von integrierten Schalt kreisen, 
dadurch gekennzeichnet , 

daii die Funktion des integrierten Schaltkreises getestet 
wird, indem ein Testprograxmn ausgefuhrt wird, wobei 
Testvektoren berechnet werden und ein Fehler vorliegt, wenn 
der Vergleich der Ergebnisse mit einem vorgegebenen Soll- 
Ergebnis falsch ist, 

12. Verfahren nach Anspruch 11, dadurch gekennzeichnet , daft 
der Testalgorithmus aus einer Menge von Berechnungen und 
einem Vergleich der Berechnungen besteht, 

13. Verfahren nach Anspruch 11 und 12, dadurch 
gekennzeichnet, dafi 

in zwei- oder mehrdimensionalen Arrays aus mehreren 
Rechenwerken der Testalgorithmus mindestens einmal innerhalb 
des Arrays getauscht/gespiegelt , 

14. Verfahren nach Anspruch 11 bis 13 dadurch 
gekennzeichnet, daft 

die Testdaten sich in einem bausteininternen Speicher 
bef inden, 

15. Verfahren nach Anspruch 11 bis 13 dadurch 
gekennzeichnet, dafi 
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die Testdaten sich in einem bausteinexternen Speicher 
befinden, 

16. Verfahren nach Anspruch 11 bis 13 dadurch 
gekennzeichnet, dali 

die Testdaten von einer tibergeordenten Einheit geladen 
werden, 

17. Verfahren nach Anspruch 11 bis 16 dadurch 
gekennzeichnet , daJi 

die Steuerung des Selbsttests bausteinintern erfolgt, 

18. Verfahren nach Anspruch 11 bis 16 dadurch 
gekennzeichnet^ daii 

die Steuerung des Selbsttests durch eine ubergeordnete 
Einheit erfolgt, 

19. Verfahren nach Anspruch 11 bis 18 dadurch 
gekennzeichnet, dafi 

der der Selbsttest beim Start des Systems durchgefiihrt wird, 

20. Verfahren nach Anspruch 11 bis 19 dadurch 
gekennzeichnet, daJi 

der Selbsttest wahrend der Wartezyklen des ablaufenden 
Anwendungsprogrammes (IDLE-Zyklen) durchgefOhrt wird, 

21. Verfahren nach Anspruch 11 bis 19 dadurch 
gekennzeichnet^ daii 

der Selbsttest vom Anwendungsprogramm aus aufgerufen wird 
Oder in das Anwendungsprogramm integriert ist. 

22. Verfahren nach Anspruch 11 bis 21 dadurch 
gekennzeichnet, dai3 
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die sich in den Rechenwerken befindlichen Daten vor Ablauf 
des Testalgorithmusses in einen chipinternen Speicher 
gesichert werden, nach Ablauf des Tests warden die Daten 
wieder aus dem Speicher geladen. 

23. Verfahren nach Anspruch 11 bis 21 dadurch 
gekennzeichnet, daft 

die sich in den Rechenwerken befindlichen Daten vor Ablauf 
des Testalgorithmusses in einen externen Speicher gesichert 
werden, nach Ablauf des Tests werden die Daten wieder aus 
dem Speicher geladen. 

24. Verfahren nach Anspruch 11 bis 21 dadurch 
gekennzeichnet, daft 

die sich die in den Rechenwerken befindlichen Register vor 
Ablauf des Testalgorithmusses abgeschaltet werden und fiir 
den Test Testregister verwendet werden, nach Ablauf des 
Tests werden die Register wieder zugeschaltet , 
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